cat("\f")
rm(list=ls())
options(scipen = 999)

library(dplyr)  #adattáblákkal való műveletekhez
library(factoextra) #k- közép klaszterezéshez
library(ggplot2) #vizualizációkhoz

#a k-közép klaszterezés taratalmaz random elemeket, ezért egy seedet alkalmazok

set.seed(123)

#betöltöm az adatokat

df <- readRDS("data/full_df.RDS")


ggplot(data = subset(df, wdist < 1000), aes(x = wdist))+
  geom_density(fill = "black")



#K-közép klaszterezés:

df_meta <- df %>% select(c("pic", "wdist"))

df_data <- df %>% select(c("R", "G", "B"))

for (i in 5:20) {
  
  km <- kmeans(df_data, centers = i, nstart = 10)
  
  saveRDS(km, paste0("data/km/km",i,".RDS"))
  
}

